Distance Metrics (Euclidean, Manhattan)

Machine Learning - মেশিন লার্নিং (Machine Learning) - K-Nearest Neighbors (KNN)
388

ডিস্ট্যান্স মেট্রিক্স মেশিন লার্নিং এবং ডেটা সায়েন্সে বিভিন্ন পয়েন্ট বা ভেক্টরের মধ্যে দূরত্ব পরিমাপ করতে ব্যবহৃত হয়। এটি বিভিন্ন এলগরিদমে যেমন ক্লাস্টারিং, শ্রেণীবদ্ধকরণ, এবং কনটিনিউয়াস বা ক্যাটেগোরিক্যাল ডেটার মধ্যে সম্পর্ক নির্ধারণে ব্যবহৃত হয়।

এখানে Euclidean Distance এবং Manhattan Distance দুটি প্রচলিত দূরত্ব পরিমাপের পদ্ধতি নিয়ে আলোচনা করা হবে।


১. ইউক্লিডিয়ান ডিস্ট্যান্স (Euclidean Distance)

ইউক্লিডিয়ান ডিস্ট্যান্স হলো দুটি পয়েন্টের মধ্যে সরল (স্ট্রেইট) লাইন দ্বারা পরিমাপিত দূরত্ব, যা পিথাগোরাস থিওরেম এর ভিত্তিতে গণনা করা হয়। এটি সাধারণত দুটি পয়েন্টের মধ্যে সরলরেখার দূরত্ব পরিমাপ করতে ব্যবহৃত হয়।

ফর্মুলা:

এটি সাধারণত দুটি পয়েন্ট P(x1,y1)P(x_1, y_1) এবং Q(x2,y2)Q(x_2, y_2) এর মধ্যে পরিমাপ করা হয়:

d(P,Q)=(x2x1)2+(y2y1)2d(P, Q) = \sqrt{(x_2 - x_1)^2 + (y_2 - y_1)^2}

এটি দুই মাত্রিক (2D) পয়েন্টের জন্য, তবে তিন বা তার বেশি মাত্রিক পয়েন্টের জন্যও এটি প্রয়োগযোগ্য। 3D বা nn-ডি স্পেসে, ফর্মুলা হবে:

d(P,Q)=i=1n(xiyi)2d(P, Q) = \sqrt{\sum_{i=1}^{n}(x_i - y_i)^2}

উদাহরণ:

ধরা যাক দুটি পয়েন্ট:

  • পয়েন্ট A (3, 4)
  • পয়েন্ট B (6, 8)

তাদের ইউক্লিডিয়ান ডিস্ট্যান্স হবে:

d(A,B)=(63)2+(84)2=32+42=9+16=25=5d(A, B) = \sqrt{(6 - 3)^2 + (8 - 4)^2} = \sqrt{3^2 + 4^2} = \sqrt{9 + 16} = \sqrt{25} = 5

বৈশিষ্ট্য:

  • এটি সরলরেখার বা "স্ট্রেইট-লাইন" দূরত্ব পরিমাপ করে।
  • সর্বাধিক ব্যবহৃত ডিস্ট্যান্স মেট্রিক্স এবং কনটিনিউয়াস ডেটার জন্য আদর্শ।
  • সাধারণত, কনটিনিউয়াস বা নিরবচ্ছিন্ন বৈশিষ্ট্যের মধ্যে সম্পর্ক নির্ধারণের জন্য ব্যবহার করা হয়।

২. মানহাটান ডিস্ট্যান্স (Manhattan Distance)

মানহাটান ডিস্ট্যান্স হলো দুটি পয়েন্টের মধ্যে অনুভূমিক এবং উল্লম্বভাবে চলার মাধ্যমে পরিমাপিত দূরত্ব, অর্থাৎ এটি কোনো "ব্লক"-এ চলার মতো এবং এটি সোজাসুজি (স্ট্রেইট) চলার পথে নয়, বরং মাত্রিক অক্ষরেখা বরাবর চলার মাধ্যমে পরিমাপ করা হয়। এই পদ্ধতি মূলত গ্রিড বা রাস্তার মতো কাঠামোয় ব্যবহৃত হয় যেখানে পয়েন্ট দুটি একে অপরের প্রতি অনুভূমিক বা উল্লম্বভাবে মাপা হয়।

ফর্মুলা:

তিন বা বেশি মাত্রিক ক্ষেত্রে, দুটি পয়েন্ট P(x1,y1)P(x_1, y_1) এবং Q(x2,y2)Q(x_2, y_2) এর মধ্যে মানহাটান ডিস্ট্যান্সের ফর্মুলা হবে:

d(P,Q)=i=1nxiyid(P, Q) = \sum_{i=1}^{n} |x_i - y_i|

উদাহরণ:

ধরা যাক দুটি পয়েন্ট:

  • পয়েন্ট A (3, 4)
  • পয়েন্ট B (6, 8)

তাদের মানহাটান ডিস্ট্যান্স হবে:

d(A,B)=63+84=3+4=7d(A, B) = |6 - 3| + |8 - 4| = 3 + 4 = 7

বৈশিষ্ট্য:

  • এটি অনুভূমিক এবং উল্লম্ব দূরত্ব পরিমাপ করে, অর্থাৎ পাথের মত চলা হয় (যেমন, রাস্তা ধরে চলা)।
  • এটি যখন ডেটার মধ্যে একাধিক মাত্রার পার্থক্য থাকে, বিশেষত গ্রিডের মধ্যে, তখন অধিক কার্যকরী।
  • কেবলমাত্র সোজা লাইন বা সোজাসুজি চলার ক্ষেত্রে ব্যবহার করা হয় না, বরং কিছু নির্দিষ্ট পাথ অনুসরণ করে পরিমাপ করা হয়।

ইউক্লিডিয়ান এবং মানহাটান ডিস্ট্যান্সের মধ্যে পার্থক্য:

বৈশিষ্ট্যইউক্লিডিয়ান ডিস্ট্যান্সমানহাটান ডিস্ট্যান্স
পথসরলরেখা (স্ট্রেইট লাইন)অনুভূমিক এবং উল্লম্ব (Grid-like)
ফর্মুলাd(P,Q)=(xiyi)2d(P, Q) = \sqrt{\sum (x_i - y_i)^2}( d(P, Q) = \sum
ব্যবহারকনটিনিউয়াস ডেটা, 2D, 3D স্পেসেগ্রিড বা রাস্তা-ভিত্তিক কাঠামো
তুলনামূলকছোট পরিসরে কম দূরত্ব পরিমাপসাধারণত বৃহৎ পরিসরে বেশি দূরত্ব পরিমাপ
প্রয়োগ ক্ষেত্রস্পেস, ভেক্টর স্পেস, সিগনেচাররাস্তা ম্যাপ, শহরের ব্লক, গ্রিডের অবস্থা

উপসংহার:

  • ইউক্লিডিয়ান ডিস্ট্যান্স সাধারণত সোজাসুজি (স্ট্রেইট) পথ পরিমাপের জন্য ব্যবহৃত হয়, যা কনটিনিউয়াস বা নিরবচ্ছিন্ন ডেটার মধ্যে ব্যবহৃত হয়। এটি সিগনেচার, গ্রাফ এবং ভেক্টর স্পেসে ব্যবহার করা হয়।
  • মানহাটান ডিস্ট্যান্স অনুভূমিক এবং উল্লম্ব পথ পরিমাপ করে, এবং এটি গ্রিড ভিত্তিক কাঠামো বা রাস্তার মানচিত্রে ব্যবহৃত হয়।

এগুলো যথাযথভাবে ব্যবহার করা হলে, আপনার মডেল বা অ্যালগরিদম আরো নির্ভুল এবং কার্যকরী হতে পারে।

Content added By
Promotion
NEW SATT AI এখন আপনাকে সাহায্য করতে পারে।

Are you sure to start over?

Loading...